## 1. 准备「图像分类」任务数据 ### 1.1 图像分类的数据结构 图像分类的数据集存放结构如下: ``` data/mydataset/ |-- train_img |-- train_0001.jpg |-- train_0002.jpg |-- ... |-- val_img |-- val_0001.jpg |-- val_0002.jpg |-- ... |-- test_img |-- test_0001.jpg |-- test_0002.jpg |-- ... |-- train_list.txt |-- val_list.txt |-- test_list.txt ``` 其中.txt文件用于存放与相应图像对应的标注信息,train_img、val_img、test_img用于存放训练集、验证集、测试集的图像,而val_img是非必须的; 同时.txt文件名字固定,其余文件名字可自己根据实际情况设定。 ### 1.2 构造标注文件 标注信息都存放在.txt中,其中每行代表一张图像的信息。若是train_list.txt和val_list.txt,则其每一行由图像文件的相对路径(相对于图像存放文件夹的父目录,例如***1.1***中的data/mydataset/)和该张图像的类别id组成,中间由空格分隔开;若是test_list.txt,则其每一行是图像文件的相对路径。如下所示,是train_list.txt中标注信息的例子: ``` train_img/train_0001.jpg 0 train_img/train_0002.jpg 1 ... ``` 【注意】图像相对路径的命名不可以出现空格和中文字符,应由英文字符和下划线等字符组成。类别id则是由数字组成。